1
向通用GPU架构演进的变革
AI032Lesson 12
00:00

NVIDIA GT200Fermi架构 标志着 第三代GPU计算。此前的架构以图形处理为核心,经过“改造”用于数学计算;而Fermi则是从零开始为 通用GPU(GPGPU) 应用而设计的。

1. 从图形优先到计算优先

与专注于纹理单元和严格数据并行性的GT200不同,Fermi引入了统一的内存请求路径。这一转变开启了 计算思维,使开发者能够突破简单的二维网格映射,转向复杂的C++算法开发。

GT200:图形演进仅支持纹理单元无统一缓存仅支持手动共享内存Fermi:通用GPU革命统一的L2缓存带有L1缓存的流多处理器(SM)IEEE 754-2008 双精度浮点

2. 内存层次结构的飞跃

Fermi引入了真正的 L1/L2缓存层级结构 并符合 IEEE 754-2008 浮点标准。这意味着研究人员不再需要为每个字节手动管理“临时存储”内存(共享内存),从而能够支持不规则的数据结构,并实现适合科学工程领域的双精度计算精度。

main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>